“桃园三结义”、“二桃杀三士”、“桃李满天下”……在中国传统文化中,与桃相关的典故浩如烟海,早在先秦时期,《诗经》中就有“园有桃,其实之肴”的描写。作为一种起源于中国的重要水果,桃在中华文化诞生之初就扮演着重要的角色,桃树的驯化历史几乎和中华文明的历史一样悠久。而近些年来,桃的育种工作更进一步地提升了果实品质。来自郑州果树研究所等单位的研究者们对桃树进行了大规模重测序分析,回溯了桃数千年的驯化历史,揭开了基因组里沉睡已久的秘密。
研究者收集了共480个桃树品系,包括52个野生种(wild relative)、213个地方种(landrace)和215个栽培种(improved cultivar)。提取DNA后进行高通量重测序,重测序数据比对到桃树参考基因组上并call变异,并进行质量过滤去除低质量的变异。使用Beagle软件进行基因型填充后,使用PHYLIP构建NJ系统发育树,使用GCTA进行PCA分析,以及STRUCTURE进行群体结构分析,来对所有桃树品系的群体结构和进化关系进行分析。研究者使用了PLINK、δaδi、VCFtools、VariScan等软件分别分析了连锁不平衡(LD)、有效种群大小、遗传多样性(Fst、Tajima's D)。同时,研究者还对各品系的桃进行了表型鉴定,并对多种性状进行了GWAS分析。重测序共产生719 Gb数据,平均测序深度6.4×。比对和变异挖掘共得到约498万个高质量SNP,平均每kb碱基包含21.9个SNP位点。在群体结构分析中,研究者将所有的桃品系按照野生种、地方种和栽培种分为Group I、II、III,其中Group II按照地域分为Group II-1(东北/华南)、Group II-2(长江流域/云贵高原)、Group II-3(华北/西北),Group III按照改良地域分为Group III-1(日韩地区)和Group III-2(欧美地区)。从系统发育树结合采样地图来看,可以清晰地看出桃树驯化过程中的历史脉络。而从PCA分析的结果看,相较于野生种,所有人工栽培的品系都聚集在一起,并且Fst值也显示出人工栽培的桃群体之间遗传距离较小,而各群体与野生种群体之间的遗传距离相对较大。并且同时,从野生种到地方种过程中遗传多样性的丧失以及连锁不平衡的减弱,显示出桃驯化过程中的强烈瓶颈效应。
各品系桃的群体结构、遗传多样性以及连锁不平衡分析结果通过对核酸多态性进行分析,发现了142个驯化过程中的选择清除区域和104个改良过程中的选择清除区域,分别包括3683和3039个基因,共覆盖桃基因组的18.6%。桃的果实重量是驯化过程中最重要的核心性状之一,从野生种到栽培种的驯化过程中桃的果实重量增加了十倍。研究者综合比较了已经报道过的果实重量QTL、选择清除分析结果以及GWAS分析结果,比较结果发现在驯化过程中对这些已知的QTL进行的选择有助于桃果实的增大。例如在桃4号染色体上的一个已知果实重量QTL区域,出现了显著的核酸多态性降低,并且在该位置的一个SNP在GWAS分析中与果实重量性状显著关联。同时在此QTL区域中,发现了一个编码生长素响应GH3蛋白的基因,该基因在果实发育的早期具有较高的表达量,并且该基因的同源基因被证实在番茄的驯化过程中与果实重量有强烈联系。桃驯化和改良过程中的全基因组选择信号以及相关的部分GWAS结果
而果实的味道是驯化过程中的另一个重要性状。野生种桃子的味道有明显的苦味,地方种的桃苦味比较不明显,而栽培种的桃已经完全没有苦味,并且有着更高的糖含量,意味着果实风味在驯化和改良过程中都是重要的受选择性状。果实风味与果实中的糖、酸等物质的含量以及物质的平衡有关,并且之前的研究发现了多个与之相关的QTL,其中有部分QTL位于经受了两轮选择的基因组位置上。例如酚类物质的含量在野生种桃中的含量显著较高,而有两个与酚类物质含量相关的QTL位于染色体2和染色体4上,且显示了强烈的驯化信号,在此区域内也发现了与酚类物质含量显著关联的GWAS标记,Fst也显示此区域野生种与本地种之间有很高的遗传距离。与桃酚类物质和可溶固形物含量相关的GWAS和选择清除分析结果除了果实大小和味道以外,桃的需寒量也是一个重要的受选择性状,帮助桃在更广泛的地区种植,并适应全球变暖的趋势。针对需寒量的GWAS分析发现了数个显著关联的标记,其中有3个关联信号位于或靠近之前发现的需寒量QTL,其中染色体1上的一个需寒量QTL对表型贡献度达到44.8%。结合选择信号来看,有两个位于需寒量QTL位置的GWAS信号落在了受选择区域,并且较高的Fst值也支持这几个QTL受到的选择。除此之外,研究者还对包括果实质地在驯化过程中的改变、东西方桃改良过程的差异等进行了细致的研究,为我们清晰地揭示了桃在整个驯化和改良过程中各种性状变化的深层机制。
想要将研究做到深入、细致、系统,从课题的前期准备就需要用心准备。研究所选取的材料需要足够有代表性,获得的数据才能够对想要研究的对象进行充分的解释。本研究所选取的各个品系不仅丰富且对桃驯化和改良的各个过程都具有足够的代表性,将本研究的系统性提升了一个档次。同时在数据的利用方面,研究者不仅进行了GWAS和选择清除分析等多种挖掘方式,结合性状从多个角度对桃驯化改良过程中发生的变化进行阐释,还结合前人丰富的研究结果,进一步将桃的各类研究整合起来,使得整个结果更加丰满,让本研究成了深厚学术基础与细致数据分析相结合的典范。当然,如果能利用代谢组对果实的表型进行更加细致的鉴定,并与GWAS分析相结合,相信能够从更细致的角度,揭示其中更多的进化之谜。参考文献:Li Y, Cao K, Zhu G, et al. Genomic analyses of an extensive collection of wild and cultivated accessions provide new insights into peach breeding history[J]. Genome biology, 2019, 20(1): 36.需要原文的小伙伴,公众号回复“桃重测序”,即刻下载原文